Stable Diffusionでkawaiiを出す
Stable Diffusionがpublicになった当初、2022/8/24 ごろの試行の記録
fine tuningのツールは出揃っていなかったし、ノウハウもほぼなかった暗中模索の時代
全然出ないので試行錯誤する
Twitterでよく回ってくるのは852話氏のツイート 300文字ぐらい入れてるらしい
便利定型句
code:zsh
conda activate ldm
python scripts/txt2img.py --prompt "a photograph of an astronaut riding a horse" --plms --n_samples 2
code:dir
\\wsl$\Ubuntu\home\motoso
TODO
アニメのスタイルを見つける
今後進化予定のようなのでそこそこでいいかも
構図をだせるか
あおりがだせるか
ふかんがだせるか
ショットをつかいわけられるか
❌ full shot\
補足的に映像読み込ませた方が早そう基素.icon
pix2pixやる
まとめ
512x512以上で出力する
基礎実験からいこう。
目標が定まらないと走りづらいので、月ノ美兎を最終目標とする
後から補足: VRAM節約のために256×256で出力していたため、最初の方は低品質な出力になっている。途中で気づいて512にした
"kawaii girl"
最弱の呪文からはじめよう。
https://gyazo.com/26f13449a7d25733472da3086afa6073
dark haired japanese high school girl
https://gyazo.com/3e137fb46c37cf9a795eea817165299d
左下の学習元がきになるが、右下は明らかに謎の物体だし右上も理解不能。左上はなんか惜しい。この中だと左上か中央上がイメージに近い
実車っぽいのは今は目指してないのでstyleをアニメやイラストに固定したい
Hokusai級に有名なイラストレーターって誰?
たぶんアニメのスクショのほうが学習してるはずなのでアニメによせてみる
dark haired japanese high school girl. japanese anime style
https://gyazo.com/09afec6f2f9bc911f42040cf80d9b4e6
路線はだいぶ良くなった(左下は謎)
髪の毛短いなと思ったけど、長さを指定していなかった。腰ぐらいまである。
japanese high school girl with waist-length black hair. japanese anime style.
https://gyazo.com/47957e02f700252da2adf01505bd139d
離れたな!
5/6がwaist-lengthじゃなくない?
この呪文はだめかも
委員長は吸い込まれそうな青い目をしている
japanese high school girl with waist-length black hair, blue eyes that seem to suck you in. japanese anime style
https://gyazo.com/8edd9fead11e748bc1e564399e76391c
2枚目と同じやつが出てるね?右上は3枚目と同じだし。右下はいいかげんにしろ!!
顔のアップばっかりなので、全身描いてほしい。
full shotにしよう
japanese high school girl with waist-length black hair, blue eyes that seem to suck you in. japanese anime style. full shot.
https://gyazo.com/830ed3843e8170efccca77a70ff7135d
いやミリもfull shotじゃないんですけど...
右下が変わらないのなんなの?1つ前にめっちゃ影響されてる?
制服を着てほしい
japanese high school girl in uniform with waist-length black hair, blue eyes. japanese anime style. full shot.
https://gyazo.com/928204488580588d820002d365706e7c
一つ前のものに依存しているかかくにんするために、みぎしたのがぞうを消した
関係なかった(コード上も関係なさそう)
明らかに同じようなものが出ているのはなぜ?
シードが同じ?だから
ベクトルがそんなに変わらないから
ここから512x512にした(VRAMの関係上2x2が限界)
サイズが関係あるのか気になるのでjapanese high school girl in uniform with waist-length black hair, blue eyes. japanese anime style. full shot.で試す
https://gyazo.com/37a12b42e9465f58ea732e23f0b09f9e
かなり変わった!しかも明らかに良い方向に
full shotはルーンとして効果がなさそうだから削る
japanese anime styleだけでは限界がありそう。画風を2Dキャラクターよりにするにはどうすればいいか?
手っ取り早いのはあちらで有名な作品を入れてしまうことだろう
japanese high school girl in uniform with waist-length black hair, blue eyes. RWBY style https://gyazo.com/44698b5321e527d106f4c7a4a7c4b8bf
ビンゴ
調査
アニメ風にするルーン
--beta以前のMidjourney。うまくいってない。
アニメっぽくするにはbold outline, few gradationsなどを入れると良いことが分かった
https://pbs.twimg.com/media/Fa6p0veaQAEYaA3.png
makoto_shinkai_artgerm_ilya_kuvshinov_beautiful_anime_women_with_black_red_and_red_lace_trim_long_black_and_red_hair_wind_powers_symme_-H_640_-C_18.0_-n_9_-i_-S_1859528417_ts-1660525367_idx-8
他の人の限界
最近流行ってる風の雰囲気の良い環境と女の子を描いてもらおうとしたがむずかしく、結局顔のクローズアップになってしまう。
好きそうな雰囲気が出たら50ぐらいまで増やし、ベクトルが変化しなければ150ぐらいまで上げてみる、みたいな場合と、50まで増やしてベクトルが変わったら22~30ぐらいを探る場合があった。
kawaii→二次元イラストっぽくなる
髪の色や長さによって顔の雰囲気が変わる
上記の作品群は上手くいった作品しか載せておらず、大量の失敗作品を糧に成り立っている。
code:zsh
Sampling: [00:13<00:13, 13.24s/it
Running PLMS Sampling with 50 timesteps